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摘要 : 白花 刺 续 断 是 藏 区 一 种 常用 的 药 用 植物 ， 但 其 叶绿体 全 基因 组 的 研究 较 少 。 为 揭示 该 
物种 叶绿体 全 基因 组 的 基本 特征 并 探讨 其 谱系 遗传 结构 , 该 研究 利用 Humina 测序 平台 对 来 
自 5 个 野生 居 群 的 10 个 白花 刺 续 断 个 体 进行 二 代 测 序 ， 经 组 装 、 注 释 , 得 到 10 条 完整 的 叶 
绿 体 全 基因 组 序列 ， 并 对 它们 的 基因 组 特征 和 居 群 间 的 谱系 进化 关系 进行 了 初步 研究 。 研究 
结果 表明 : (1) 白花 刺 续 断 的 叶绿体 全 基因 组 大 小 为 155 335-156 266 bp， 共 注释 113 个 基 
因 , 包括 72 个 蛋白 编码 基因 、30 个 tRNA 基因 和 4 个 rRNA 基因 ,其 叶绿体 基因 组 的 大 小 、 
结构 、GC 含量 及 基因 组 成 等 方面 在 种 内 高 度 保守 ; 〈2) 基因 组 比较 分 析 表 明 ， 白 花 刺 续 断 
变异 较 大 的 片段 均 位 于 单 拷贝 区 ， 且 下 边界 未 出 现 明 显 的 扩张 和 收缩 ; (30 群体 遗传 分 析 
发 现 ,白花 刺 续 断 的 野生 居 群 具有 明显 的 地 理 遗 传 结构 , 不 同居 群 间 在 遗传 距离 与 地 理 距 离 
上 有 具有 一 定 的 相关 性 。 该 研究 表明 ， 白 花 刺 续 断 叶绿体 基因 组 在 种 内 居 群 水 平 上 比较 保守 ， 
是 叶 绿 体 基因 组 可 在 居 群 水 平 上 揭示 物种 的 地 理 遗 传 结 构 。 这 为 后 续 开 展 刺 续 断 属 物种 群体 
遗传 学 和 系统 发 育 基因 组 学 研究 奠定 了 基础 。 
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Analysis of complete chloroplast genomes from wild 


populations of Acanthocalyx alba 
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Abstract: Acanthocalyx alba is a common medicinal plant in Tibetan region, and there are few 
reports on its whole chloroplast genome now. In order to reveal basic characteristics of the whole 
chloroplast genome of Acanthocalyx alba and explore its phylogeographic structure, ten 
individuals from five wild populations were sequenced by Illumina sequencing platform. After 
assembly and annotation, ten complete chloroplast genome sequences were obtained. Moreover, 
genome characteristics and phylogenetic relationships were explored. The results were as follows: 
(1) The complete chloroplast genomes of Acanthocalyx alba were 155 335 - 156 266 bp. A total of 

113 genes were annotated, including 72 protein-coding genes, 30 tRNA genes and four rRNA 
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genes. The chloroplast genome was highly conserved in species in terms of size, structure, GC 
content and gene composition; (2) Genomic comparative analysis showed that the fragments with 
large variation were located in the single copy region, and there was no obvious expansion and 
contraction at the IR boundaries; (3) Analysis of population genetics revealed rich genetic 
diversity in the wild populations and significant geographic structure, and there were certain 
relationships between genetic distances and geographic distances. This study lays the foundation 
for studies on population genetics and phylogenomics of species in Acanthocalyx. 
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白花 刺 续 断 CAcanthocalyx alba (Hand.-Mazz.) M.J.Cannon)， 又 名 和 白花 刺 参 ， 隶 属于 川 
续 断 科 CDipsacaceae) 刺 续 断 属 (4canthocalyx)。 该 属 在 我 国有 4 种 2 变种 ， 主 要 分 布 在 云 
南 、 四 川 、 西 藏 等 地 (Hong et al., 2011)。 白 花 刺 续 断 以 全 草 入 药 ， 为 传统 藏 药 ， 其 藏 药 名 
为 “ 江 才 嘎 保 ” 始 载 于 《四 部 医 典 》( 国 家 中 医药 管理 局 中 华 本 草编 委 会 ，2002)。 它 是 国 
家 卫生 部 藏 药 药品 标准 中 收 载 的 三 种 “ 刺 参 ”之 一 (青海 省 药品 检验 所 和 青海 省 藏医 药 研究 
所 ，1996)， 上 有 具有 健 胃 、 催 吐 之 功效 。 内 服 可 用 于 关节 疼痛 、 小 便 失 禁 、 腰 痛 、 肪 晤 及 口 腿 
至 斜 ， 外 用 治疗 郊 、 化 脓 性 创伤 ， 还 具有 抗 肿瘤 作用 (国家 中 医药 管理 局 中 华 本 草编 委 会 ， 
2002; 杨 竞 生 ，1989)。 近 年 来 ， 有 关 白 花 刺 续 断 的 研究 主要 集中 在 其 有 效 成 分 、 含 量 测定 
及 提取 工艺 等 方面 ( 吴 春 蕾 等 , 2011; Zhang etal., 2013; 杨 圣 贤 等 , 2014; 张 志 锋 等 , 2015 )。 
如 张 志 锋 等 (2018) 发 现 白花 刺 续 断 中 含有 皂苷 、 生 物 碱 、 当 醇 等 类 型 化 合 物 ， 其 中 皂苷 类 
是 其 主要 有 效 成 分 。 而 分 子 生 物 学 方面 的 研究 较 少 ， 仅 有 Wang 5& (20200 报道 了 该 种 的 叶 
绿 体 基因 组 序列 。 那 么 , 在 白花 刺 续 断 的 种 内 居 群 水 平 上 ， 其 叶绿体 基因 组 序列 有 什么 变化 
特征 呢 ? 

叶绿体 基因 组 在 被 子 植物 中 通常 为 母系 遗传 。 与 核 基因 组 和 线粒体 基因 组 相 比 ,其 基因 
进化 速率 慢 , 且 在 基因 组 成 及 结构 方面 比较 保守 (Smith, 2015; Szymon et al., 2016; Du et al., 
2020)， 这 使 得 叶绿体 基因 组 在 植物 物种 鉴定 和 谱系 进化 研究 具有 重要 作用 。Cui 等 〈2019 ) 
对 比分 析 了 32 PE (Amomum) 植物 叶绿体 基因 组 ， 结 果 表 明 叶 绿 体 全 基因 组 可 准确 
鉴定 豆 苞 属 物 种 ， 李 依 容 等 (2020) 利用 叶绿体 基因 组 揭示 了 民族 药 溃 白 珠 〈Gaultheria 
leucocarpa var. yunnanensis) 复合 群 的 系统 发 育 关 系 ; Zhang 等 (2021) 基于 叶绿体 基因 组 
重建 了 桃 金 娘 目 (Myrtiflorae) 的 物种 分 化 时 间 和 系统 发 育 关系 。 但 叶绿体 基因 组 在 长 期 的 
进化 过 程 中 ， 结 构 上 会 发 生 一 些 变 异 ， 如 反问 重复 区 收缩 、 倒 位 、 基 因 和 内 含 子 的 丢失 等 
(Zhang et al., 2014; Liao et al., 2020; 姜 汶 君 等 ，2020)， 这 些 结构 变异 为 揭示 物种 系统 发 
育 和 进化 关系 等 提供 了 遗传 信息 。 由 此 可 见 , 植物 叶绿体 全 基因 组 序列 能 提供 丰富 的 遗传 信 
息 ， 在 分 类 鉴定 、 系 统 发 育 及 进化 等 方面 具有 重要 意义 。 那 么 ,植物 叶绿体 全 基因 组 是 否 适 
用 于 种 内 居 群 水 平 上 的 群体 遗传 学 研究 ? 由 于 群体 水 平 上 测序 成 本 较 高 , 数据 分 析 方 法 尚 不 
成 熟 等 ， 这 方面 的 相关 研究 还 比较 少 。 

本 研究 , 以 白花 刺 续 断 野生 居 群 个 体 为 研究 材料 , 拟 采 用 二 代 测 序 技术 进行 高 通 量 测序 ， 
并 对 其 叶绿体 全 基因 组 进行 拼接 、 注 释 及 进化 分 析 。 拟 探讨 以 下 科学 问题 : CIO 白花 刺 续 断 
的 叶绿体 全 基因 组 序列 有 什么 特征 ? 〈2) 叶绿体 全 基因 组 能 否 用 于 解析 白花 刺 续 断 种 内 居 
群 水 平 上 的 遗传 结构 ? 通过 该 研究 , 将 为 刺 续 断 属相 关 物 种 的 分 子 遗 传 学 研究 莫 定 基础 , 也 
为 叶绿体 全 基因 组 在 群体 遗传 研究 方面 开展 初步 尝试 。 


1 材料 与 方法 
1.1 实验 材料 
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本 实验 中 ， 白 花 刺 续 断 分 子 材料 采 自 于 四 川 省 甘孜 州 的 5 个 野生 居 群 〈 表 1)， 共 10 份 
实验 材料 。 经 大 理 大 学 张 德 全 教授 鉴定 为 白花 刺 续 断 (Acanthocalyx alba (Hand.-Mazz.) 
M.JCannon)， 其 凭证 标本 保存 于 大 理 大 学 药学 院 药 用 植物 与 生 药 标本 馆 。 

表 1 白花 刺 续 断 样 品 采 集 信息 


Table 1 Collection information of Acanthocalyx alba 


编号 采集 地 点 凭证 标本 经 纬度 海拔 

Number Locality Voucher specimen Latitude/Longitude Altitude (m) 

SD01 四 川 省 稻城 县 桑 堆 ZDQ17115 29?07'53.41"/100?10'21.41" 4005 
Sangdui, Daocheng, Sichuan 

SD02 四 川 省 稻城 县 桑 堆 ZDQ17115 29?07'53.41"/100?10'21.41" 4005 
Sangdui, Daocheng, Sichuan 

YD01 四 川 省 稻城 县 亚丁 机 场 ZDQ17105 29°15'17.87"/100°05'02.76” 3 823 
Yading Airport, 
Daocheng, Sichuan 

YD02 四 川 省 稻城 县 亚丁 机 场 ZDQ17105 29?15'17.87"/100?05'02.76" 3 823 
Yading airport, 


已 


cheng, Sichuan 
省 道 孚 县 ZDQ17178 30?44'59.62"/101?19'51.19" 3850 


fu, Sichuan 
34H ZDQI17178 30?44'59.62"/101?19'51.19" 3850 


fu, Sichuan 


S 


SECECEGXSE 
S 


| 

J 

"Ti 

c 

N 
uymumUu 


LI01 省 理 塘 县 ZDQ17124 29?29'04.73"/100?13'40.35" 4510 
Litang, Sichuan 

LI02 四 川 省 理 塘 县 ZDQ17124 29?29'04.73"/100?13'40.35" 4510 
Litang, Sichuan 

KD01 四 川 省 康定 ZDQ16035 30?02'51.00"/101?24'01.57" | 3884 
Kangding, Sichuan 

KD02 14 川 省 康定 ZDQ16035 30?02'51.00"/101?24'01.57" | 3884 


Kangding, Sichuan 


1.2 基因 组 DNA 提取 与 测序 
DNA 提取 采用 改良 的 CTAB 方法 ， 从 硅胶 干燥 的 叶片 材料 中 提取 总 基因 组 DNA。 利用 
Covaris 超声 波 破 人 碎 仪 将 基因 组 DNA. 片段 化 ， 经 末端 修复 、 加 A 尾 、 加 测序 接头 、 纯 化 及 
PCR 扩 增 等 过 程 ,构建 测序 文库 。 文 库 经 质量 检测 合格 后 , 使 用 带 有 双 末端 pair-end (2x300bp) 
c Illumina Hiseq 2 500 平台 进行 二 代 测 序 ， 整 个 测序 工作 在 北京 诺 禾 致 源 生物 科技 有 限 公 司 完 
13 ”叶绿体 全 基因 组 的 组 装 、 注 释 
经 二 代 测 序 ， 得 到 4G 左右 原始 数据 (Raw Data)， 经 Trimmomatic v.0.32 过 滤 人 处理 后 ， 
利用 GetOrganelle.py 进行 组 装 ， 后 续 数 据 处 理 参 考 本 课题 组 前 期 工作 〈 胡 海 楼 和 张 德 全 ， 
2021)。 以 白花 刺 续 断 Acanthocalyx alba. (序列 号 :NC_045055 ) 为 参考 基因 组 , 使 用 Geneious 
8.0.2 软件 完成 白花 刺 续 断 叶 绿 体 全 基因 组 的 注释 ， 并 将 其 提交 到 NCBI 数据 库 
C https://www.ncbi.nlm.nih.gov/ ) ， 利用 在 线 工 具 Organellar Genome Draw 
Chttps://chlorobox.mpimp-golm.mpg.de/OGDraw.html) 绘制 叶绿体 基因 组 物理 图 谱 。 
14 IR/SC 边界 收缩 扩张 及 SSR 分 析 
将 注释 好 的 10 条 基因 组 序列 上 传 至 网 站 IRscope (https://irscope.shinyapps.io/irapp/〉 进 
ÍT IR 边界 的 收缩 和 扩张 分 析 ， 最 后 得 到 的 图 片 采用 绘图 工具 Adobe Illustrator CC 2015 进行 
人 工 调整 。 同 时 ， 利 用 MISA 软件 搜索 简单 重复 序列 (SSR: Simple sequence repeats) 位 点 
并 分 析 白 花 刺 续 断 叶绿体 基因 组 的 SSR 特征 。 
1.5 序列 差异 比较 分 析 
在 采用 MAFFT v.7.129 软件 对 10 条 白花 刺 续 断 叶 绿 体 基因 组 序列 进行 比 对 后 ， 使 用 
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BioEdit 软件 手动 调整 序列 。 使 用 DnaSP v.7.0.26 XFIRE DSL P IEEE RE S PE (Pi) 进 
行 滑动 窗口 分 析 。 步 长 设置 为 200 bp， 窗 口 长 度 为 600 bp. P-distance 使 用 MEGA v.7.0.26 
软件 进行 统计 分 析 。 此 外 , 将 叶绿体 基因 组 序列 的 注释 进行 格式 转换 , 利用 在 线 软件 mVISTA 

(http://senome.lbl.gov/vista/mvista/submit.shtml〉 的 Shuffle-LAGAN 模式 对 白花 刺 续 断 叶 绿 
体 全 基因 组 比较 分 析 ， 选 取 Acanthocalyx alba (NC 045055). 作为 参考 序列 。 
L6 系统 发 育 分 析 

根据 白花 刺 续 断 叶 绿 体 基 因 组 注释 信息 , 从 NCBI 数据 库 下 载 已 发 表 的 川 续 断 科 及 忍冬 

Æ} (Caprifoliaceae) 的 11 种 植物 的 叶绿体 全 基因 组 序列 ， 用 于 系统 发 育 分 析 。 选 择 小 粒 咖 
IHE C Coffea arabica LL.) 和 中 粒 咖 啡 (C. arabica Pierre ex Froehn.) 为 外 类 群 , 使 用 MAFFT V.7.1 
将 白花 刺 续 断 与 下 载 的 叶绿体 全 基因 组 序列 进行 多 序列 比 对 。 系统 发 育 树 的 构建 , 采用 了 最 
大 似 然 法 (Maximum likelihood, ML )、 最 大 简约 法 (Maximum parsimony, MP) 和 贝 叶 斯 推 
论 法 (Bayesian inference, BD. 三 种 方法 。 核 苷 酸 蔡 代 模 型 经 jModelTest v 2.1.7 软件 筛选 定 
为 GTR+G 模型 。 利 用 RAxML v.8.2.4 软件 构建 ML 系统 树 , 采用 快速 靳 带 算法 , 重复 1 000 
次 。 利 用 MEGA v.7.0.26 软件 构建 MP 树 ， 重 复 1 000 次 。 利 用 MrBayes v3.2.6 构建 BI 树 ， 
基于 马尔 科 夫 链 蒙 特 卡 洛 (MCMC) 算法 ， 计 算 100 万 代 ， 每 隔 1000 代 取 样 一 次 ， 侈 弃 前 
pun 25% 棵 树 ， 根 据 剩余 的 样本 构建 一 致 树 。 


< 2 结果 与 分 析 


2.1 基因 组 结构 与 基本 特征 
白花 刺 续 断 的 叶绿体 全 基因 组 为 常见 的 四 分 体 结构 ， 由 两 个 反 向 重复 区 IRs (Inverted 

repeats )、 一 个 大 单 拷贝 区 LSC CLarge single copy) 和 一 个 小 单 描 贝 区 SSC (Small single copy) 
组 成 ( 表 2， 图 1)。 拼 接 后 的 白花 刺 续 断 叶绿体 基因 组 ， 全 长 为 155 335-156 266 bp, GC 
含量 为 38.1~38.2%。 各 区 上段 长 度 分别 为 : 89 027~89 076 bp (LSC)、17 689~17 842 bp (SSC), 
24 253-24 666 bp (IRs). 4 个 区 段 中 GC 含量 最 高 的 是 下 区 (42.8~43.2% )， 其 次 是 LSC 
[X (36.594) 和 SSC 区 (32.9%)。 经 注释 ， 得 到 113 个 基因 ， 包 括 72 个 编码 蛋白 基因 、30 
A tRNA 基因 、 4 个 rRNA 基因 和 7 个 假 基因 (clpP、accD、 ycf2、 ycfl、 rps18. rps3 和 ycf3)。 
此 外 ， 和 白花 刺 续 断 叶绿体 全 基因 组 中 有 16 个 基因 含有 内 含 子 (intron )， 且 均 只 含有 一 个 内 
含 子 ( 表 3)。 
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Bll RNA polymerase 

国 ribosomal proteins (SSU) 
Bil ribosomal proteins (LSU) 
国 clpP, matK 

Bl other genes 

O hypothetical chloroplast reading frames (ycf) 
Bl transfer RNAs 

E ribosomal RNAs 


圆圈 外 的 基因 是 顺 时 针 转 录 ， 圆 圈 内 的 基因 是 逆 时 针 。 图 中 颜色 表示 功能 基 
含量 ， 浅 灰色 对 应 于 AT 含量 。 


The genes outside the circle are transcribed clockwise, while the genes inside the circle are transcribed 


儿 
> 


。 内 部 的 深 灰 色 对 应 于 GC 


T 


counterclockwise. The colors here represent functional genes. The inner dark gray corresponds to the GC content 


and the light gray corresponds to the AT content. 
图 1 白花 刺 续 断 叶绿体 全 基因 组 图 谱 


Fig.1 Gene map of complete chloroplast genome in Acanthocalyx alba 


表 2 白花 刺 续 断 10 条 叶绿体 全 基因 组 序列 特征 的 比较 


Table 2 Comparison on ten chloroplast complete genomes in Acanthocalyx alba 


编号 总 长 大 单 拷贝 区 小 单 拷贝 区 反问 重复 区 GC% 基因 数 蛋白 编码 基因 tRNA rRNA GenBank 登录 号 
Number Total (bp) LSC (bp) SSC (bp) IR (bp) Total genes CDS Accession number 
SD01 156 082 89 030 17 740 24 656 38.1 113 72 30 4 MW053688 
SD02 155 335 89 035 17 794 24 253 38.2 113 72 30 4 MW053689 
YD01 156 110 89 036 17 842 24 616 38.1 113 72 30 4 MW053690 
YD02 156 053 89 036 17 705 24 656 38.1 113 72 30 4 MW053687 
DF01 156 266 89 027 17 713 24 763 38.1 113 72 30 4 MW053686 
DF02 156 266 89 027 17 713 24 763 38.1 113 72 30 4 MW053685 
LTOI 156 054 89 032 17 790 24 616 38.1 113 72 30 4 MWO018701 
LTO2 156 054 89 032 17 790 24 616 38.1 113 72 30 4 MW018702 
KD01 156 097 89 076 17 689 24 666 38.1 113 72 30 4 MW018703 
KD02 156 097 89 076 17 689 24 666 38.1 113 72 30 4 MW018704 


A3 白花 刺 续 断 叶绿体 全 基因 组 基因 组 成 


Table 3 Composition of complete chloroplast genome of Acanthocalyx alba 


基因 类 别 基因 功能 基因 名 称 
Gene group Gene function Gene name 
自我 复制 核糖 体 大 亚 基 rpl2, rpl12**, rpl32, rpl22, rpll6*, rpll4, rpi36, 


Large subunit of ribosone 


Selfreplication ”核糖 体 小 亚 基 


Small subunit of ribosone 
RNA 聚合 酶 RNA polymerase 
TRNA 


光合 作用 光学 系统 1 Photosystem I 
Photosynthesis ”光学 系统 2 Photosystem II 


NADH- Ji a 
NADH dehydrogenase 
细胞 色素 复合 物 
Cytochrome b/f complex 
ATP 合 酶 ATP synthase 


二 磷酸 核 酮 糖 羧 化 酶 大 亚 基 基 


Large subunit of rubisco 


其 他 基因 翻译 起 始 因子 

Other genes Translational initation factor 
成 熟 酶 基因 Maturase 

蛋白酶 基因 Protease 

包 膜 蛋白 基因 

Envelope membrane protein 

乙酰 CoA 凑 化 酶 的 亚 基 

Subunit of Acetyl-carboxylase 

C 型 细胞 色素 合成 

C-type cytochrome synthesis 

开放 阅读 框 


Open reading frames 


FH 


rpl20, rpi33 

rps]!, rpsl5, rps19, rps3*, rps8, rpsll, rps12!*, 
rpsl8*, rps4, rpsl4. rps2, rpsl6* 

rpoA, rpoB, rpoCl*, rpoC2 

rrnl6!, rrn23', rrn4.5!, rrn5! 

trnl-CAU!, tr3L-CAA!, trnV-GAC!, trnI-GAU ™*, 
trnA-UGC™, trnR-ACG!, trnN-GUU I, trnL-UAG, 
trnP-UGG, trnW-CCA, trnM-CAU, trnV-UAC*, 
trnF-GAA , trnL-UAA*, trnT-UGU, trnS-GGA, 
trnfM-CAU, trnG-UCC, trnS-UGA, trnT-GGU, 
trnE-UUC, trnY-GUA, trnD-GUC, trnC-GCA , 
trnR-UCU, trnG-GCC*, trnS-GCU, trnQ-UUG, 
trnK-UUU*, trnH-GUG 


psaC, psal, psal, psaA, psaB 

psbH, psbN, psbT, psbB, psbE, psbF, psbL, psbJ, 
psbZ, psbC, psbD, psbM, psbl, psbK, psbA 
ndhB'*, ndhH, ndhA*, ndhl, ndhG, ndhE, ndhD, 
ndhF, ndhC, ndhK, ndhJ 

petD*, petB*, petG, petL. petA, petN 


atpB, atpE. atpl, atpH, atpF*, atpA 
rbcL 


CCSA 


ycf2*, yofl*, ycf4, ycf3* 


注 : “了 "表示 该 基因 位 于 IR 区 ,“%" 表 示 该 基因 含有 内 含 子 ,，“ 党 "代表 假 基因 。 


Note: "I" indicates that the gene is located in the IR region, "*" indicates that the gene contains introns, and "#" 


represents a pseudogene. 
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22 IR/SC 边界 收缩 扩张 及 SSR 分 析 

叶绿体 基因 组 由 两 个 反 向 重复 的 下 区 .LSC 区 与 SSC 区 构成 , 因此 存在 LSC/IRb、IRb/SSC、 
SSC/IRa 与 IRa/LSC 四 个 边界 。 在 基因 组 进化 过 程 中 ，4 个 边界 会 发 生 扩 张 与 收缩 ， 使 某 些 基因 
HEA IR 区 或 单 拷贝 区 ,不同 地 点 白花 刺 续 断 的 叶绿体 基因 组 的 4 个 边界 相对 保守 (图 2)。LSC/IRb 
边界 在 白花 刺 续 断 中 位 于 rp123 基因 内 部 ， 且 位 于 LSC 区 域 的 差异 不 大 ， 分 别 是 185-186 bp: 
SD01、YD01、YD02、LT01、LT02、KD01、KD02 的 IRb/SSC 边界 基因 完全 相同 ， 位 于 IRb 区 
trnN-GUU 基因 138 bp 处 , 而 SD02、DF01、DF02 的 wrnN-GUU 基因 扩张 到 SSC 内 部 ,距离 IRb/SSC 
边界 48-223 bp: SSC/IRa 的 边界 在 白花 刺 续 断 基 因 组 中 都 位 于 yfl 基因 内 部 ，IRa/LSC 边界 全 
部 位 于 trnH-GUG 基因 附近 。 

利用 MISA 软件 对 白花 刺 续 断 叶 绿 体 全 基因 组 进行 分 析 ， 在 白花 刺 续 断 10 条 序列 中 分 别 检 
iJ] 70. 68. 70. 70. 74. 74. 70. 70. 71. 714^ SSR 位 点 (图 3B)。SSR 最 丰富 的 类 型 为 单 
核 苷 酸 重复 ， 其 次 是 二 核 音 酸 重复 、 三 核 苷 酸 重复 、 五 核 音 酸 重复 、 四 核 苷 酸 重 复 和 六 核 苷 酸 重 
复 。 白 花 刺 续 断 叶绿体 基因 组 中 的 SSR 主要 是 由 A 和 T 组 成 ， 其 中 大 部 分 是 以 AT 碱 基 构成 的 
单 核 昔 酸 重复 ， 其 次 是 由 ATTA 构成 的 二 核 苷 酸 重 复 〈 图 3A)。 进 一 步 分 析 表 明 ， 大 部 分 SSR 
WLF LSC 区 域 ， 小 部 分 位 于 SSC 和 IR 区 域 〈 图 3C)。 同 时 ， 基 因 组 中 的 SSR 大 部 分 分 布 于 基 
因 间 区 (Intergenic spacer, IGS) 中 ， 其 他 少数 SSR 分 布 在 内 含 子 和 和 蛋白 编码 基因 (CDS) 中 
3D). 


LSC/IRb IRb/SSC SSC/IRa IRa/LSC 
185bp 124bp EM 37SSbp — 1313bp 
PP EA EA psbA 
—— iii 
89 030 bp 24 656 bp 17740 bp 24 656 bp iml 
185bp 124bp 223bp 3755bp_ 1 313b 
| BN prm em 5 393b EA E 
SD02 155335 bp 
89 035 bp 24253 bp 17 794 bp 24253 bp EZN 
185bp 124bp 138bp 3755bp  1313bp 
YDOI 156 110 bp OO Bob bn EZ os | 
89 036 bp 24 616bp 17842 bp 24616 bp 
185bp124bp 138bp EN 3755bp  1313bp 
Loi d n EA 
YD02 156053 bp a BENE MUR HR BID oo RA 
89 036 bp 24 656 bp 17 705 bp 24 656 bp 
185bp 124bp Wm 3755bp 1313bp 
mp2 pl23 LA IN m 5315bH tmil psbA 
DFoi 1s62sshp MAN O EE E c CBS 
89 027 bp 24 763 bp 17 713 bp 24763 bp TZE 
185bp 124bp NL 375Sbp  1313bp 
rpl2 plz tral Tm] xf EETET irl psbA 
DF02 156266 bp 
89 027 bp 24 763 bp 17713 bp 24763 bp L2] 
185bp 124bp 138bp 3755bp  1313bp 
p23 [ext ] EA psbA 
LT01 156 054 bp 
89 032 bp 24 616 bp 17 790 bp 24 616 bp irn 
18sbp 124bp Eod 138bp ~、 3755bp 1313bp 
ml2 m3 tN E 435b psbA 
E —O—— o — — -B 
89032 bp 24 616 bp 17 790 bp 24 616 bp L7] 
186bp 123bp 138bp N 3755bp  1313bp 
KDO1 156 097 bp za M 
89076 bp 24 666 bp 17 689 bp 24 666 bp EZI 
186bp 123bp 138bp x 37SSbp — 1313bp. 
LA Lun | ne EEEET EU 
KD02 156 097 bp tu SEED LRL Bu UR gio P 
89 076 bp 24 666 bp 17 689 bp 24 666 bp 


图 2 白花 刺 续 断 叶绿体 基因 组 LSC、SSC 和 IR 边缘 区 的 比较 
Fig. 2 Comparison of LSC, SSC, and IR border regions among ten chloroplast genomes in 


Acanthocalyx alba 


202202.00041v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


A B E 
70 70 70 
70 58 
e| FH [s 6 
60 
iT 11 11 11 
50 
Hexe- 
ü p 
"ET opent 
di nTets- 
mum á 
Bg 30 E 
E nbi- 
20 BMom. 
10 
0 
SD0 SD02 YD0l! YD02 DF01 DF02 IT01 LT02 KD01 KDO? 


Sample number 


SSR 数量 


Number of SSR 


0 
SD01 $SD02 YD01 YD02 DF01 DF02 LT01 LT02 KD01 KDO2 
样品 编 号 
Sample number 


SDUl  SD02 YD0l YD02 DF0l DF02 LTOL  LTU2 KD0l KD02 


Sample number 


A. SD01 叶绿体 基因 组 中 不 同 重 复 类 型 SSR 出 现 频率 ; B. 10 个 基因 组 中 不 同 SSR 类 型 的 数目 ; C. 在 LSC、SSC 
和 IR 区 域 中 出 现 SSR 的 频率 ; D. 在 IGS、CDS 和 内 含 子 中 出 现 SSR 的 频率 。 
A. Frequency of SSR motifs in different repeat types of SDO1 chloroplast genome; B. number different SSRs type 


detected in ten genomes; C. frequency of identified SSR in LSC, SSC, and IR regions; D. frequency of identified SSR in 
IGS, CDS, and Intron. 
3 白花 刺 续 断 10 条 叶绿体 基因 组 的 SSR 分 析 


Fig. 3 Analysis of simple sequence repeat (SSR) on ten chloroplast genomes in Acanthocalyx alba 


23 ”序列 差异 比较 分 析 

将 比 对 好 的 5 个 地 区 白花 刺 续 断 叶绿体 基因 组 进行 Sliding window 分 析 (图 4)。 结 果 显 示 ， 
SSC 区 域 的 变异 水 平 最 高 , IR 区域 最 低 。 同 时 , 筛选 到 3 条 高 变异 序列 , 分 别 位 于 LSC 区 (rpoC1) 
和 SSC [X GidhF 和 rpI32-trnL-UAG) . rf rpl32-trnL-UAG 的 变异 性 最 高 ,其 次 是 ndhF, 而 rpoC1 
最 低 。 此 外 ， 本 研究 中 以 SD01 作为 参考 序列 ， 与 其 余 9 条 白花 刺 续 断 叶绿体 基因 组 进行 两 两 比 
EINAT o 结果 显示 , 叶绿体 基因 组 序列 中 非 编码 区 变异 高 于 蛋白 编码 区 域 , 单 拷贝 区 (LSC&SSC ) 
变异 明显 大 于 反 向 重复 区 (IR)。5 个 地 区 白花 刺 续 断 叶 绿 体 基 因 组 序列 整体 上 高 度 相 似 ， 变 异 
较 大 的 基因 有 rpoC2、psbC、rrn23 和 ycfl， 其 他 基因 保守 程度 非常 高 。 基 因 间 区 的 变异 大 于 基 
天 区 ,如 atpF-atpH、psaB-psaA ~ psaA-ycf3~trnM-CAU-atpE ~ psbF-psbE\psbE-petL\rrn5-trnN-ACG.、 
trnR-ACG-trmnN-GUU、trnL-UAG-ccsA( 图 5)。 从 这 些 区 域 中 ， 可 开发 特异 性 片段 ， 用 于 该 属 种 
闻 及 种 下 水 平 的 系统 进化 与 发 育 研 究 。 
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窗口 长 度 : 


rpoCi 


479 9 486 18511 27542 36551 45624 54679 63758 72784 


REME 


Nucleotide position 


600bp， 步 长 : 200bp. X$: 窗口 中 点 的 位 置 ，Y 轴 : 每 个 窗口 的 核 昔 酸 多 样 性 。 
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rpi32-trri-UAG 


ndhF 


81813 90933 99933 108934 118611 127661 137075 


Window length: 600 bp, step size: 200 bp. X-axis: position of the midpoint of a window; Y-axis: nucleotide 


diversity of each window. 


图 4 白花 刺 续 断 10 条 叶绿体 全 基因 


组 的 滑动 窗口 分 析 


Fig. 4 Sliding window analysis of ten chloroplast genomes in Acanthocalyx alba 
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基于 VISTA 的 标识 图 显示 以 SD01 为 参照 ， 对 九 个 白花 刺 续 断 进 行 序列 鉴定 。 


VISTA-based identify plot showing sequence identify among nine Acanthocalyx alba using SD01 as a reference. 


5 白花 刺 续 断 10 条 叶绿体 基因 组 的 可 视 化 比 对 


Fig. 5 Visualization alignment of ten chloroplast genomes in Acanthocalyx alba 


24 系统 发 育 分 析 
本 研究 利用 P-distance 种 间 遗 传 变 异 及 核 背 酸 替 换 比 较 了 10 条 白花 刺 续 断 的 叶绿体 全 


基因 组 i 


且 大 部 分 序列 间 地 理 位 置 越 远 ， 其 相互 间 P-distance 和 核 苷 酸 差 异 值 越 大 〈 表 4)。 系 统 发 育 


化 差异 ， 研 究 结果 表明 ，P-distance 为 0.000 0~0.000 7， 核 芽 酸 差异 值 为 0~1 515, 


分 析 结 果 显 示 ， 三 种 方法 构建 的 进化 树 所 反映 的 不 同 野生 居 群 之 间 的 进化 关系 相似 〈 图 6)， 
也 与 遗传 距离 分 析 的 结果 相 吻 合 。 在 系统 发 育 树 中 ， 康 定 KD) MEF DF) 的 四 个 个 体 
最 早 分 化 出 来 ， 其 次 是 亚丁 (YD) 和 桑 堆 (SD )， 最 后 是 理 塘 (LT) 的 两 个 个 体 。 但 亚丁 
CYD) PRHE SD) 的 四 个 个 体 不 能 明显 分 开 。 


3€ 4 白花 刺 续 断 个 体 间 遗 传 距离 与 核 昔 酸 差异 值 
Table 4 Genetic distances and nucleotide difference values among individuals of Acanthocalyx alba 

SD01 SD02 YD01 YD02 DF01 DF02 LTO1 LT02 KD01 KD02 
SD01 940 263 45 819 818 218 218 588 588 
SD02 0.000 1 791 933 1515 1514 746 746 1306 1306 
YDO0I 0.000 1 0.000 0 256 851 850 67 67 625 625 
YD02 0.000 0 0.000 1 0.000 1 781 780 211 211 551 551 
DF01 0.000 6 0.000 6 0.000 6 0.000 6 1 805 805 576 576 
DF02 0.000 6 0.000 6 0.000 6 0.000 6 0.000 0 804 804 575 575 
LTOI 0.000 1 0.000 1 0.000 1 0.000 1 0.000 6 0.000 6 0 581 581 
LT02 0.000 1 0.000 1 0.000 1 0.000 1 0.000 6 0.000 6 0.000 0 581 581 
KD01 0.0007 0.0007 0.0007 0.000 7 0.000 5 0.000 5 0.000 7 0.000 7 0 
KD02 0.000 7 0.000 7 0.000 7 0.000 7 0.000 5 0.000 5 0.000 7 0.000 7 0.000 0 
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Scabiosa tschiliensis: £k dE NC_045050 
Pterocephalus hookeri&&WT3R T4 45 MN524611 
Dipsacus japonicus 日 本 续 断 MN524645 


Dipsacus asper 川 续 断 NC _039748 


续 断 MW018701(LTO01) 
续 断 MW018702(LT02) 
续 断 MW053689(SD02) 
续 断 MW053690(YD01) 
续 断 MW053688(SD01) 
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Dipsacaceae 川 续 断 科 


Acanthocalyx alba KAEMI ZW NC 045055 


100/001 [一 一 Lonicera confusa ERZA NC 045045 


Lonicera japonicazd.& NC 026839 


Sambucus nigra 西 洋 接 骨 木 MT457821 . . " 
Caprifoliaceae A fj] 


Sambucus williamsiifi£4Y7k NC 033878 


AT Viburnum erosum'& Ej Sli MN641480 


Viburnum japonicum | ÆJ ŻE MH036493 


1091001 [———— Coffea arabica 小 粒 咖啡 NC 008535 


Rubiaceaeyj f} 


Coffea canepjhora 中 粒 咖 啡 NC_030053 


上 面 的 节点 数 是 支持 值 ， 左 边 是 MP 自 展 值 ， 中 间 是 ML 自 展 值 ， 右 边 是 贝 叶 斯 后 验 概率 PP) 值 。 图 中 
加 黑 部 分 为 本 文 主要 研究 对 象 。 


Number above nodes are support values with MP bootstrap values on the left, ML bootstrap values in the middle, 


Bayesian posterior probabilities (PP) values on the right. The black part in the figure is the main research object of 

this paper. 

图 6 利用 最 大 简约 法 (MP )、 最 大 似 然 法 ML) 和 贝 叶 斯 分 析 法 (OBD 研究 了 10 个 白花 
刺 续 断 叶绿体 全 基因 组 的 系统 发 育 关系 


Fig. 6 Phylogenetic relationship of ten Acanthocalyx alba based on complete chloroplast genome 


using maximum parsimony (MP), maximum likelihood (ML), and Bayesian analyses (BI) ethods 
3 讨论 与 结论 


本 研究 报导 了 白花 刺 续 断 的 叶绿体 全 基因 组 序列 特征 , 并 在 居 群 水 平 上 揭示 了 其 地 理 遗 
传 结构 。 不 同 野生 居 群 的 叶绿体 基因 组 所 编码 的 基因 类 别 、 数 量 及 排列 顺序 高 度 一 致 。 同 日 
个 体 间 具有 高 度 相 似 的 GC 含量 ， 单 个 序列 中 IRs 区 序列 的 GC 含量 最 高 。 白 花 刺 续 断 叶 绿 
体 基因 组 中 共 含 有 7 个 假 基 因 , 其 中 5 个 假 基因 是 川 续 断 科 植 物 所 共有 的 (clpP、accD、 ycf2« 
ycfl、rps18)， 故 推测 川 续 断 科 植 物 假 基 因 现 象 可 能 是 普遍 存在 的 (Wang et al., 2020)。 叶 绿 
体 SSR 位 点 是 一 种 高 效 的 分 子 标记 。 本 研究 中 ， 白 花 刺 续 断 叶绿体 全 基因 组 序列 的 SSRs 
主要 以 A/T 碱 基 为 主 ， 这 与 其 它 被 子 植 物 中 的 情况 相似 (Guo et al., 2017; Na et al., 2018; 
Chen et al., 2019)。 同 时 ， 这 也 进一步 证 实 了 叶绿体 SSRs 主要 是 由 polyA 和 polyT 重复 所 
构成 ， 而 较 少 含有 C 或 G 串联 重复 的 观点 (Kuang etal., 2011)。 此 外 ， 这 些 SSRs 主要 分 布 
在 两 个 单 找 贝 区 ， 故 推测 这 些 高 AT 含量 的 SSRs 和 分 布 于 IR 区 的 TRNA 序列 可 能 是 导致 
叶绿体 基因 组 中 GC 含量 偏 低 以 及 各 区 域 碱 基 含量 差异 的 潜在 原因 ( 张 明 英 等 ，2020)。 
节 区 和 SC 区 的 扩张 和 收缩 被 认为 是 直接 影响 被 子 植物 叶绿体 基因 组 大 小 的 重要 因素 
(Wang et al., 2017; Song et al., 2019)。 本 研究 表明 ， 不 同 野生 居 群 个 体 间 叶 绿 体 基因 组 4 个 
边界 均 未 出 现 明显 的 扩张 和 收缩 现象 ， 说 明白 花 刺 续 断 叶绿体 基因 组 IRs 区 大 小 高 度 保守 ， 


j 


E 


tiL 


这 也 与 Wang 等 (2020) 的 研究 结果 一 致 。 从 叶绿体 基因 组 中 发 掘 的 高 变 片 段 ， 不 仅 可 以 在 
物种 水 平 上 用 于 系统 发 育 和 物种 鉴定 研究 , 也 可 以 在 居 群 水 平 上 提供 丰富 的 遗传 信息 ， 从 而 
揭示 物种 的 居 群 动态 与 进化 历史 等 。Fatemeh 等 (2018) 基于 rp132-trnL-UAG 对 溃 紫 草 属 
(Onosma) 物种 进行 系统 发 育 分 析 和 分 化 时 间 估 计 ; Nahla 等 (2020) 采用 rpoC1 对 首 带 属 
(Medicago ) 植 物 进行 亲缘 关系 分 析 ; Chen 等 (2020) 基 于 叶绿体 基因 组 对 贝 母 属 CFritillaria) 
植物 进行 研究 ， 结 果 发 现 筛选 出 的 ycf1 和 psbM-psbD 可 作为 特定 条 形 码 用 于 贝 母 属 植物 物种 
鉴定 。 这 些 研究 工作 也 进一步 证 实 高 变 片 段 在 物种 进化 及 鉴定 等 方面 具有 特殊 作用 。 本 研究 
中 ， 筛 选 出 3 个 高 变 片段 (rpoCl1、ndhFf 和 p132-trnL-UAG)， 可 用 于 刺 续 断 属 内 种 间 系 统 发 
育 及 种 内 群体 遗传 学 研究 。 
传统 上 , 常用 叶绿体 基因 片段 来 研究 物种 的 群体 遗传 结构 和 谱系 进化 关系 , 但 因 叶 绿 体 
片段 多 态 位 点 不 足 而 作用 有 限 (Zhang et al., 2019; Zhang et al., 2020; 刘 家 奇 等 ，2021)。 与 
之 相 比 , 叶绿体 全 基因 组 具有 极为 丰富 的 遗传 变异 , 为 复杂 植物 类 群 的 遗传 进化 研究 提供 有 
效 手段 。Wang 等 (2020) 基于 美国 山 核 桃 (Carya illinoinensis) 两 个 不 同居 群 间 叶 绿 体 基 
因 组 核 苷 酸 差异 性 ， 揭 示 了 该 物种 居 群 水 平 的 遗传 多 样 性 。 本 研究 中 ， 和 白花 刺 续 断 5 个 野生 
居 群 间 具 有 较为 明显 的 遗传 结构 , 个 体 间 的 遗传 距离 、 核 苷 酸 差异 值 与 地 理 距 离 之 间 呈 较 好 
的 相关 性 。 这 也 与 系统 发 育 树 所 揭示 的 进化 关系 相 吻 合 。 值 得 注意 的 是 ， 桑 堆 CSDO ) 和 亚 
T YD) 的 四 个 个 体 没 有 形成 独立 分 支 ， 这 可 能 是 两 个 居 群 间 地 理 距离 较 近 引起 相对 频繁 
的 基因 流 所 致 。 这 一 结果 也 说 明 , 与 核 基因 组 相 比 ， 叶 绿 体 基因 组 进化 较 慢 及 单亲 遗传 的 特 
性 ， 其 作用 也 有 明显 的 局 限 性 。 
综 上 所 述 , 叶绿体 全 基因 组 序列 具有 极为 丰富 的 遗传 信息 , 可 为 复杂 植物 类 群 及 种 下 居 
群 水 平 上 的 群体 遗传 及 谱系 进化 研究 提供 有 效 手 段 。 但 由 于 三 代 测 序 的 价格 仍旧 较为 高 昂 ， 
本 文中 居 群 样本 量 较 少 , 该 研究 结果 的 科学 性 尚 有 不 足 。 因 此 ,叶绿体 基因 组 能 否 作 为 传统 
的 分 子 片段 或 标记 的 技术 补充 ， 需要 更 多 研究 工作 来 验证 。 此 外 ,将 叶绿体 全 基因 组 用 于 群 
体 遗 传 学 分 析 的 数据 分 析 方 法 也 有 待 于 进一步 完善 。 
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